library(tidyverse)
## -- Attaching packages ------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2 v purrr 0.3.4
## v tibble 3.0.1 v dplyr 1.0.0
## v tidyr 1.1.0 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.5.0
## -- Conflicts ---------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(ggpubr)
library(reshape2)
##
## Attaching package: 'reshape2'
## The following object is masked from 'package:tidyr':
##
## smiths
library(patchwork)
library(gtools)
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:gtools':
##
## logit
## The following object is masked from 'package:dplyr':
##
## recode
## The following object is masked from 'package:purrr':
##
## some
library(psych)
##
## Attaching package: 'psych'
## The following object is masked from 'package:car':
##
## logit
## The following object is masked from 'package:gtools':
##
## logit
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
library(pastecs)
##
## Attaching package: 'pastecs'
## The following objects are masked from 'package:dplyr':
##
## first, last
## The following object is masked from 'package:tidyr':
##
## extract
library(rstatix)
##
## Attaching package: 'rstatix'
## The following object is masked from 'package:stats':
##
## filter
library(gridExtra)
##
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
##
## combine
library(data.table)
##
## Attaching package: 'data.table'
## The following objects are masked from 'package:pastecs':
##
## first, last
## The following objects are masked from 'package:reshape2':
##
## dcast, melt
## The following objects are masked from 'package:dplyr':
##
## between, first, last
## The following object is masked from 'package:purrr':
##
## transpose
library(kableExtra)
##
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
##
## group_rows
knitr::opts_chunk$set(include = TRUE, echo = FALSE, warning = FALSE) # Generelle Einstellungen für alle Chunks: include = TRUE (Output anzeigenlassen), echo = TRUE (Codes anzeigen lassen)
options(knitr.kable.NA = '') # damit in der Tabelle NAs als leere Felder angezeigt werden
Zunächst werden die Variablen “hh_oev_entf_kat” und “hh_oev_entf_kat_neu” mit folgenden Klassen gebildet.
Klassen: 1…-90, 2…0 min, 3… 1-5 min, 4… 6-15 min, 5… 16-30 min, 6… 31-60 min, 7… 61-120 min, 8… 120-180 min, 9…>180 min)
Zugangszeiten im ÖU 2013/2014-Datensatz mit dem Wert -94, also > 180 min, werden kurzfristig auf 300 gesetzt.
Es wird nun das gleiche Histogramm gebildet, allerdings mit den hochgerechneten Werten.
Zunächst werden die beiden Datensätze (VAO und ÖU) zusammmengefügt. Anschließend wird die Hochrechnung durchgeführt. Leider funktionierte die Funktion “weights” nicht, weshalb die Hochrechnung über Umwege erfolgte.
## [1] "hh_nr" "hst_gehdauer" "hst_gehlaenge"
## [4] "hst_vm" "hst_zug" "hst_sbahn"
## [7] "hst_ubahn" "hst_tram" "hst_bus"
## [10] "hst_regbus" "hst_type" "hst_kategorie"
## [13] "hst_gehdauer_kat" "hh_wohnbdl" "hh_wohnraumtyp"
## [16] "hh_wohnbezirk" "hh_wohngemeinde" "hh_gr"
## [19] "hh_gru6" "hh_gr617" "hh_grue18"
## [22] "hgr_kat" "hh_oev_entf" "hh_oev_entf_kat"
## [25] "hh_oev_bus" "hh_oev_strb" "hh_oev_ubahn"
## [28] "hh_oev_bahn" "hh_carsharing" "hh_wirtschsituation"
## [31] "fzg_radges" "fzg_e_rad" "fzg_mot"
## [34] "fzg_pkw" "hh_hochrechnungsfaktor" "hh_kobasis"
## [37] "hh_öv_güte" "hst_gehlänge_" "hst_gehdauer_"
## [40] "hh_oev_entf_kat_neu"
Nun wird eine Häufigkeitstabelle erzeugt und geplottet.
Alle Zugangszeiten > 180 min werden zu -94, um dies an ÖU 2013/2014 anzugleichen. Überall, wo die Zugangszeit auf -94 gesetzt wird, wird auch der Zugangsweg auf -94 gesetzt.
Die ÖU 2013/2014-Zugangszeiten, die vorher auf imaginäre 300 Minuten gesetzt wurden, werden wieder auf -94 gesetzt.
Zwecks Vereinfachung fürs Rechnen werden alle negativen Werte (z.B. nicht anwendbar, keine Haltestelle gefunden, Zugangszeit > 180 min) zu NA umgerechnet, da R fehlende Werte in vielen Fällen automatisch bei Rechnungen ignoriert.
Die Variable “hst_bus” wird zur Variable “hst_lokbus” umgenannt. Danach werden die Variablen “hst_lokbus” und “hst_regbus” zur Variable “hst_bus” sowie die Variablen “hst_zug” und “hst_sbahn” zu “hst_bahn” kombiniert, da im ÖU 2013/2014-Datensatz nicht nach den beiden Bus- bzw. Bahnkategorien unterschieden wurde.
Zugangszeiten von 0 min werden durch 1 min ersetzt: 1) werden dadurch Divisionen ermöglicht. 2) entspricht dies dem Durchschnitt der ermittelten Zugangszeit bei den gleichen Distanzen.
“Nein”-Antworten, die im ÖU 2013/2014-Datensatz mit 2 codiert wurden, werden zu 0 codiert und so an den VAO-Datensatz angepasst.
Es werden nun die Zugangszeiten in einem Liniendiagramm dargestellt, um Unterschiede zwischen den ermittelten und angegebenen Zugangszeiten feststellen zu können.
Häufigkeit der angegebenen/ermittelten Zugangszeiten pro Minute
Und nun mit kumulierten Häufigkeiten
Nicht benötigte bzw. doppelte Variablen werden in dem kombinierten Datensatz (“Vergleich”) ausgeblendet.
## [1] "hh_nr" "hst_gehdauer" "hst_gehlaenge"
## [4] "hst_vm" "hst_zug" "hst_sbahn"
## [7] "hst_ubahn" "hst_tram" "hst_lokbus"
## [10] "hst_regbus" "hst_type" "hst_kategorie"
## [13] "hst_gehdauer_kat" "hst_bus" "hst_bahn"
## [16] "hh_wohnbdl" "hh_wohnraumtyp" "hh_wohnbezirk"
## [19] "hh_wohngemeinde" "hh_gr" "hh_gru6"
## [22] "hh_gr617" "hh_grue18" "hgr_kat"
## [25] "hh_oev_entf" "hh_oev_entf_kat" "hh_oev_bus"
## [28] "hh_oev_strb" "hh_oev_ubahn" "hh_oev_bahn"
## [31] "hh_carsharing" "hh_wirtschsituation" "fzg_radges"
## [34] "fzg_e_rad" "fzg_mot" "fzg_pkw"
## [37] "hh_hochrechnungsfaktor" "hh_kobasis" "hh_öv_güte"
## [40] "hst_gehlänge_" "hst_gehdauer_" "hh_oev_entf_kat_neu"
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 101.0 101.0 103.0 227.7 410.0 430.0
Die Klassifizierung ist für die statistische Auswertung erforderlich.
Um die Übereinstimmung der Zugangszeiten feststellen zu können, wird einerseits ein sogenannter Übereinstimmungsfaktor eingeführt, andererseits werden die Zuganszeiten in einem Punktdiagramm dargestellt.
Für Vergleiche zwischen den Zugangszeiten der beiden Datensätze wird ein sogenannter Übereinstimmungsfaktor eingeführt. Dabei wird die ÖU 2013/2014-Zugangszeit durch die VAO-Zugangszeit dividiert. Ein Übereinstimmungsfaktor zwischen 0 und kleiner 1 bedeutet, dass die in ÖU 2013/2014 angegebene Zugangszeit die ermittelte Zugangszeit unterschätzt. Ein Übereinstimmungsfaktor von genau 1 bedeutet, dass die Zugangszeiten ident sind und alle Werte größer 1 bedeuten, dass die in ÖU 2013/2014 angegebene Zugangszeit die ermittelte Zugangszeit überschätzt. Jene Werte können zwischen > 1 und unendlich liegen. Da aufgrund dieser Asymmetrie direkte Vergleiche kaum möglich sind, wird in den Diagrammen eine logarithmische Skala herangezogen. Der Übereinstimmungsfaktor ist folgendermaßen zu interpretieren: - Übereinstimmungsfaktor < 1: Zugangszeit ÖU 2013/2014 < VAO (Zugangszeit wird unterschätzt) - Übereinstimmungsfaktor = 1: Zugangszeiten sind ident - Übereinstimmungsfaktor > 1: Zugangszeit ÖU 2013/2014 > VAO (Zugangszeit wird überschätzt)
Zusätzlich zu dem Übereinstimmungsfaktor wird der logarithmierte Übereinstimmungsfaktor angegeben (lg10 (Zugangszeit ÖU/Zugangszeit VAO)). Dieser ist folgendermaßen zu interpretieren:
| Übereinstimmungsgrad | Zugangszeit | Interpretation | |
|---|---|---|---|
| 2 | < 1 (< 0 bei lg) | ÖU 2013/2014 < VAO | Unterschätzen der Zugangszeit |
| 3 | = 1 (= 0 bei lg) | ÖU 2013/2014 = VAO | Idente Zugangszeit |
| 4 | > 1 (> 0 bei lg) | ÖU 2013/2014 > VAO | Überschätzen der Zugangszeit |
Zusätzlich wird der Übereinstimmungsfaktor in fünf Klassen eingeteilt, die die Kenntnis, also den Grad der Übereinstimmung beschreiben. Dazu wird der nicht logarithmisierte Übereinstimmungfaktor herangezogen. Es ergeben sich folgende Klassen:
| Übereinstimmungsgrad | Kenntnis | Farbzuordnung | Farbe | |
|---|---|---|---|---|
| 2 | < 0,3 bzw. ≥ 3,31 | Sehr schlecht | Dunkelrot | |
| 3 | 0,30 bis < 0,50 bzw. 2,01 bis < 3,31 | Schlecht | Hellrot | |
| 4 | 0,50 bis < 0,70 bzw. 1,43 bis < 2,01 | Mäßig | Orange | |
| 5 | 0,70 bis < 0,90 bzw. 1,12 bis < 1,43 | Gut | Hellgrün | |
| 6 | 0,90 bis < 1,12 | Sehr gut | Dunkelgrün |
Auf der x-Achse befindet sich die ÖU 2013/2014-Zugangszeit, auf der y-Achse die VAO-Zugangszeit. Der Übereinstimmungsgrad (Kenntnis) ist in den zuvor eingeführten Kategorien farblich dargestellt. Zusätzlich wird eine durch den Ursprung gehende Regressionsgerade hinzugefügt und die Formel der Regressionsgerade angeführt.
Nun wird der Teilbereich von Zugangszeiten bis 15 min dargestellt. Die Punktansammlungen ergeben sich aufgrund der gewählten Darstellung des Punktdiagramms. Je quadratischer und dünkler ein Bereich, umso mehr Werte befinden sich dort.
Nun wird der Teilbereich von Zugangszeiten bis 15 min dargestellt. Die Punktansammlungen ergeben sich aufgrund der gewählten Darstellung des Punktdiagramms. Je quadratischer und dünkler ein Bereich, umso mehr Werte befinden sich dort.
In weiterer Folge mittels Hypothesentests geprüft, ob verschiedene Variablen einen Einfluss auf den Übereinstimmungsfaktor haben. Dies wird zudem mittels Boxplots graphisch abgebildet, bei denen die Gruppen der untersuchten Variablen sowie die Summe dieser Gruppen einander gegenüber gestellt werden.
Vorgehensweise bei den Hypothesentests
Beschriftung der y-Achse
Zunächst werden die Labels für die Angabe der Stichprobengröße und des Mittelwerts je Gruppe und für alle Gruppen gemeinsam erzeugt. Anschließend wird ein Subset gebildet und fehlende Werte rausgefiltert. Danach wird geplottet.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 5 45.616 < 2.2e-16 ***
## 16437
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hst_gehlaenge_kat
## F = 477.13, num df = 5.000, denom df = 92.584, p-value < 2.2e-16
## # A tibble: 15 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 1 2 -0.217 -0.236 -0.199 3.66e- 8 ****
## 2 gleich_entf_~ 1 3 -0.319 -0.348 -0.290 0. ****
## 3 gleich_entf_~ 1 4 -0.412 -0.456 -0.367 5.75e-11 ****
## 4 gleich_entf_~ 1 5 -0.605 -0.741 -0.468 2.99e-10 ****
## 5 gleich_entf_~ 1 6 -1.36 -2.13 -0.595 1.00e- 3 ***
## 6 gleich_entf_~ 2 3 -0.102 -0.134 -0.0696 0. ****
## 7 gleich_entf_~ 2 4 -0.194 -0.240 -0.148 5.02e-10 ****
## 8 gleich_entf_~ 2 5 -0.387 -0.524 -0.250 4.07e-10 ****
## 9 gleich_entf_~ 2 6 -1.15 -1.91 -0.378 5.00e- 3 **
## 10 gleich_entf_~ 3 4 -0.0923 -0.144 -0.0409 5.52e- 6 ****
## 11 gleich_entf_~ 3 5 -0.285 -0.424 -0.146 6.30e- 7 ****
## 12 gleich_entf_~ 3 6 -1.04 -1.81 -0.276 8.00e- 3 **
## 13 gleich_entf_~ 4 5 -0.193 -0.336 -0.0502 2.00e- 3 **
## 14 gleich_entf_~ 4 6 -0.952 -1.72 -0.184 1.50e- 2 *
## 15 gleich_entf_~ 5 6 -0.759 -1.53 0.0118 5.40e- 2 ns
## `summarise()` ungrouping output (override with `.groups` argument)
Zunächst werden die Labels für die Angabe der Stichprobengröße und des Mittelwerts je Gruppe und für alle Gruppen gemeinsam erzeugt. Anschließend wird ein Subset gebildet und fehlende Werte rausgefiltert. Danach wird geplottet.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 2834.7 < 2.2e-16 ***
## 3480288
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_wohnbdl
## F = 6760.7, num df = 8, denom df = 872114, p-value < 2.2e-16
## # A tibble: 36 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fak~ 1 2 -0.110 -0.114 -0.106 0 ****
## 2 gleich_entf_fak~ 1 3 0.0429 0.0392 0.0465 0 ****
## 3 gleich_entf_fak~ 1 4 -0.0825 -0.0861 -0.0788 0 ****
## 4 gleich_entf_fak~ 1 5 -0.0355 -0.0396 -0.0314 0 ****
## 5 gleich_entf_fak~ 1 6 0.00235 -0.00142 0.00612 0.592 ns
## 6 gleich_entf_fak~ 1 7 -0.0509 -0.0548 -0.0470 0 ****
## 7 gleich_entf_fak~ 1 8 -0.0545 -0.0590 -0.0501 0 ****
## 8 gleich_entf_fak~ 1 9 -0.0209 -0.0244 -0.0174 0 ****
## 9 gleich_entf_fak~ 2 3 0.153 0.150 0.156 0 ****
## 10 gleich_entf_fak~ 2 4 0.0275 0.0248 0.0303 0 ****
## # ... with 26 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
## # A tibble: 9 x 2
## hh_wohnbdl name
## <fct> <dbl>
## 1 1 440.
## 2 2 757.
## 3 3 448.
## 4 4 703.
## 5 5 495.
## 6 6 581.
## 7 7 496.
## 8 8 423.
## 9 9 229.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 8 17.98 < 2.2e-16 ***
## 16434
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_wohnbdl
## F = 35.948, num df = 8.0, denom df = 4100.6, p-value < 2.2e-16
## # A tibble: 36 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 1 2 -0.0968 -0.148 -0.0456 1.90e- 7 ****
## 2 gleich_entf_~ 1 3 0.0670 0.0302 0.104 6.53e- 7 ****
## 3 gleich_entf_~ 1 4 -0.0632 -0.111 -0.0152 1.00e- 3 ***
## 4 gleich_entf_~ 1 5 -0.0268 -0.0765 0.0230 7.64e- 1 ns
## 5 gleich_entf_~ 1 6 0.00989 -0.0279 0.0477 9.97e- 1 ns
## 6 gleich_entf_~ 1 7 -0.0614 -0.101 -0.0216 6.27e- 5 ****
## 7 gleich_entf_~ 1 8 -0.0639 -0.118 -0.0101 7.00e- 3 **
## 8 gleich_entf_~ 1 9 -0.00473 -0.0409 0.0314 1.00e+ 0 ns
## 9 gleich_entf_~ 2 3 0.164 0.119 0.209 4.44e-13 ****
## 10 gleich_entf_~ 2 4 0.0336 -0.0206 0.0879 5.96e- 1 ns
## # ... with 26 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 9 x 2
## hh_wohnbdl name
## <fct> <dbl>
## 1 1 0.222
## 2 2 0.204
## 3 3 0.301
## 4 4 0.222
## 5 5 0.243
## 6 6 0.252
## 7 7 0.222
## 8 8 0.222
## 9 9 0.301
## [1] 2
## # A tibble: 9 x 2
## hh_wohnbdl name
## <fct> <dbl>
## 1 1 1.67
## 2 2 1.6
## 3 3 2
## 4 4 1.67
## 5 5 1.75
## 6 6 1.79
## 7 7 1.67
## 8 8 1.67
## 9 9 2
## # A tibble: 9 x 2
## hh_wohnbdl name
## <fct> <dbl>
## 1 1 459.
## 2 2 773.
## 3 3 417.
## 4 4 665.
## 5 5 539.
## 6 6 658.
## 7 7 419.
## 8 8 458.
## 9 9 230.
## name
## 1 476.013
Der Wohnraum wurde in 4 Kategorien unterteilt.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 50.406 < 2.2e-16 ***
## 16439
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_wohnraumtyp
## F = 26.504, num df = 3.0, denom df = 6372.4, p-value < 2.2e-16
## # A tibble: 6 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 1 2 -0.0587 -0.0825 -0.0349 1.55e-8 ****
## 2 gleich_entf_~ 1 3 0.0159 -0.00427 0.0360 1.79e-1 ns
## 3 gleich_entf_~ 1 4 0.0113 -0.00780 0.0303 4.26e-1 ns
## 4 gleich_entf_~ 2 3 0.0746 0.0514 0.0978 1.36e-8 ****
## 5 gleich_entf_~ 2 4 0.0700 0.0477 0.0923 1.30e-9 ****
## 6 gleich_entf_~ 3 4 -0.00459 -0.0229 0.0137 9.17e-1 ns
## `summarise()` ungrouping output (override with `.groups` argument)
Der Wohnraum wurde in 11 Kategorien unterteilt.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 10 3228.7 < 2.2e-16 ***
## 3480611
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and UR_TYP
## F = 2611.1, num df = 10, denom df = 330065, p-value < 2.2e-16
## # A tibble: 55 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 101 102 -0.0215 -0.0242 -0.0189 0. ****
## 2 gleich_entf_~ 101 103 0.0700 0.0672 0.0729 0. ****
## 3 gleich_entf_~ 101 210 0.0307 0.0265 0.0350 0. ****
## 4 gleich_entf_~ 101 220 0.0450 0.0407 0.0494 0. ****
## 5 gleich_entf_~ 101 310 -0.00697 -0.00897 -0.00497 2.20e-14 ****
## 6 gleich_entf_~ 101 320 0.144 0.137 0.152 0. ****
## 7 gleich_entf_~ 101 330 0.0972 0.0885 0.106 0. ****
## 8 gleich_entf_~ 101 410 -0.0491 -0.0510 -0.0472 0. ****
## 9 gleich_entf_~ 101 420 -0.00607 -0.00928 -0.00286 6.05e- 8 ****
## 10 gleich_entf_~ 101 430 -0.0538 -0.0567 -0.0509 0. ****
## # ... with 45 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
Der Wohnraum wurde in 11 Kategorien unterteilt.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 10 12.731 < 2.2e-16 ***
## 16432
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and UR_TYP
## F = 7.4667, num df = 10.0, denom df = 1880.5, p-value = 9.836e-12
## # A tibble: 55 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fak~ 101 102 -0.0111 -6.02e-2 0.0380 1 ns
## 2 gleich_entf_fak~ 101 103 0.0459 8.30e-3 0.0834 0.004 **
## 3 gleich_entf_fak~ 101 210 0.0402 -2.10e-2 0.101 0.56 ns
## 4 gleich_entf_fak~ 101 220 0.0299 -3.08e-2 0.0906 0.885 ns
## 5 gleich_entf_fak~ 101 310 0.00165 -2.67e-2 0.0300 1 ns
## 6 gleich_entf_fak~ 101 320 0.131 2.71e-2 0.235 0.003 **
## 7 gleich_entf_fak~ 101 330 0.107 6.03e-4 0.214 0.047 *
## 8 gleich_entf_fak~ 101 410 -0.0292 -5.93e-2 0.000809 0.065 ns
## 9 gleich_entf_fak~ 101 420 0.0350 -7.39e-3 0.0775 0.218 ns
## 10 gleich_entf_fak~ 101 430 -0.0194 -5.77e-2 0.0189 0.867 ns
## # ... with 45 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 11 x 2
## UR_TYP name
## <ord> <dbl>
## 1 101 0.301
## 2 102 0.222
## 3 103 0.301
## 4 210 0.301
## 5 220 0.301
## 6 310 0.222
## 7 320 0.398
## 8 330 0.301
## 9 410 0.222
## 10 420 0.247
## 11 430 0.222
## [1] 2
## # A tibble: 11 x 2
## UR_TYP name
## <ord> <dbl>
## 1 101 2
## 2 102 1.67
## 3 103 2
## 4 210 2
## 5 220 2
## 6 310 1.67
## 7 320 2.5
## 8 330 2
## 9 410 1.67
## 10 420 1.76
## 11 430 1.67
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 2.8165 0.02376 *
## 16328
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_wirtschsituation
## F = 12.895, num df = 4.0, denom df = 1061.7, p-value = 2.962e-10
## # A tibble: 10 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf~ 1 2 0.0466 -0.0453 0.139 6.32e-1 ns
## 2 gleich_entf~ 1 3 0.0157 -0.0695 0.101 9.86e-1 ns
## 3 gleich_entf~ 1 4 -0.0123 -0.0977 0.0730 9.95e-1 ns
## 4 gleich_entf~ 1 5 -0.0379 -0.126 0.0498 7.57e-1 ns
## 5 gleich_entf~ 2 3 -0.0309 -0.0694 0.00760 1.83e-1 ns
## 6 gleich_entf~ 2 4 -0.0589 -0.0977 -0.0201 3.51e-4 ***
## 7 gleich_entf~ 2 5 -0.0845 -0.128 -0.0407 1.62e-6 ****
## 8 gleich_entf~ 3 4 -0.0280 -0.0451 -0.0110 6.91e-5 ****
## 9 gleich_entf~ 3 5 -0.0537 -0.0803 -0.0270 4.19e-7 ****
## 10 gleich_entf~ 4 5 -0.0256 -0.0527 0.00151 7.50e-2 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 5 x 2
## hh_wirtschsituation name
## <ord> <dbl>
## 1 1 0.222
## 2 2 0.301
## 3 3 0.301
## 4 4 0.243
## 5 5 0.222
## [1] 2
## # A tibble: 5 x 2
## hh_wirtschsituation name
## <ord> <dbl>
## 1 1 1.67
## 2 2 2
## 3 3 2
## 4 4 1.75
## 5 5 1.67
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 5 8.4681 5.145e-08 ***
## 16437
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_kobasis
## F = 6.2137, num df = 5.000, denom df = 83.588, p-value = 6.032e-05
## # A tibble: 15 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_f~ 1 2 0.0324 0.0108 0.0540 2.86e-4 ***
## 2 gleich_entf_f~ 1 3 -0.0152 -0.0727 0.0423 9.74e-1 ns
## 3 gleich_entf_f~ 1 4 -0.135 -0.756 0.486 9.77e-1 ns
## 4 gleich_entf_f~ 1 5 0.257 0.00551 0.509 4.30e-2 *
## 5 gleich_entf_f~ 1 6 -0.119 -0.353 0.116 6.68e-1 ns
## 6 gleich_entf_f~ 2 3 -0.0476 -0.108 0.0125 2.10e-1 ns
## 7 gleich_entf_f~ 2 4 -0.167 -0.788 0.454 9.45e-1 ns
## 8 gleich_entf_f~ 2 5 0.225 -0.0273 0.477 9.90e-2 ns
## 9 gleich_entf_f~ 2 6 -0.151 -0.386 0.0844 4.14e-1 ns
## 10 gleich_entf_f~ 3 4 -0.120 -0.742 0.503 9.87e-1 ns
## 11 gleich_entf_f~ 3 5 0.272 0.0159 0.529 3.30e-2 *
## 12 gleich_entf_f~ 3 6 -0.103 -0.344 0.137 8.01e-1 ns
## 13 gleich_entf_f~ 4 5 0.392 -0.258 1.04 4.29e-1 ns
## 14 gleich_entf_f~ 4 6 0.0162 -0.632 0.664 1.00e+0 ns
## 15 gleich_entf_f~ 5 6 -0.376 -0.708 -0.0429 1.80e-2 *
## `summarise()` ungrouping output (override with `.groups` argument)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 6 8.8634 1.128e-09 ***
## 13742
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hh_öv_güte
## F = 3.4591, num df = 6.0, denom df = 5988.5, p-value = 0.002055
## # A tibble: 21 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fak~ A B 0.0272 -1.89e-3 0.0563 0.085 ns
## 2 gleich_entf_fak~ A C 0.0352 3.09e-3 0.0672 0.021 *
## 3 gleich_entf_fak~ A D 0.0366 5.03e-3 0.0682 0.011 *
## 4 gleich_entf_fak~ A E 0.0324 -7.72e-4 0.0655 0.061 ns
## 5 gleich_entf_fak~ A F 0.0422 1.02e-2 0.0741 0.002 **
## 6 gleich_entf_fak~ A G 0.0323 1.82e-3 0.0628 0.03 *
## 7 gleich_entf_fak~ B C 0.00797 -2.32e-2 0.0392 0.989 ns
## 8 gleich_entf_fak~ B D 0.00943 -2.13e-2 0.0402 0.972 ns
## 9 gleich_entf_fak~ B E 0.00516 -2.71e-2 0.0374 0.999 ns
## 10 gleich_entf_fak~ B F 0.0150 -1.61e-2 0.0461 0.79 ns
## # ... with 11 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 7 12.216 1.164e-15 ***
## 13376
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and hst_kategorie
## F = 10.372, num df = 7.0, denom df = 3407.8, p-value = 6.113e-13
## # A tibble: 28 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ I II 0.0602 7.48e-4 0.120 4.50e- 2 *
## 2 gleich_entf_~ I III 0.0908 3.68e-2 0.145 1.27e- 5 ****
## 3 gleich_entf_~ I IV 0.0705 1.52e-2 0.126 3.00e- 3 **
## 4 gleich_entf_~ I V 0.0807 2.57e-2 0.136 2.65e- 4 ***
## 5 gleich_entf_~ I VI 0.0639 7.79e-3 0.120 1.30e- 2 *
## 6 gleich_entf_~ I VII 0.0904 3.62e-2 0.145 1.57e- 5 ****
## 7 gleich_entf_~ I VIII 0.141 8.15e-2 0.201 3.12e-10 ****
## 8 gleich_entf_~ II III 0.0306 -6.02e-3 0.0673 1.81e- 1 ns
## 9 gleich_entf_~ II IV 0.0102 -2.82e-2 0.0486 9.93e- 1 ns
## 10 gleich_entf_~ II V 0.0204 -1.76e-2 0.0584 7.31e- 1 ns
## # ... with 18 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
Fährt an der nächstgelegenen Haltestelle eine U-Bahn weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.3011 0.254
## 16441
## Df Sum Sq Mean Sq F value Pr(>F)
## hst_ubahn 1 5.1 5.081 38.18 6.62e-10 ***
## Residuals 16441 2188.0 0.133
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 627 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$hst_ubahn
##
## 0
## 1 6.6e-10
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_ubahn name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.111
## [1] 2
## # A tibble: 2 x 2
## hst_ubahn name
## <fct> <dbl>
## 1 0 2
## 2 1 1.29
Fährt an der nächstgelegenen Haltestelle eine Straßenbahn weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 53.067 3.37e-13 ***
## 16441
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by hst_tram
## t = 6.9296, df = 2049.2, p-value = 5.632e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.04081871 0.07304213
## sample estimates:
## mean in group 0 mean in group 1
## 0.2956331 0.2387027
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_f~ 0 1 -0.0569 -0.0730 -0.0408 6.07e-11 ****
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_tram name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.222
## [1] 2
## # A tibble: 2 x 2
## hst_tram name
## <fct> <dbl>
## 1 0 2
## 2 1 1.67
Fährt an der nächstgelegenen Haltestelle ein Bus weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.0618 0.8036
## 16441
## Df Sum Sq Mean Sq F value Pr(>F)
## hst_bus 1 0 0.03341 0.25 0.617
## Residuals 16441 2193 0.13339
## 627 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$hst_bus
##
## 0
## 1 0.62
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_bus name
## <fct> <dbl>
## 1 0 0.243
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## hst_bus name
## <fct> <dbl>
## 1 0 1.75
## 2 1 2
Fährt an der nächstgelegenen Haltestelle ein Lokalbus weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 42.607 6.887e-11 ***
## 16441
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by hst_lokbus
## t = -0.14159, df = 12645, p-value = 0.8874
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.01210543 0.01047444
## sample estimates:
## mean in group 0 mean in group 1
## 0.2900529 0.2908684
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 0.000815 -0.0105 0.0121 0.887 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_lokbus name
## <int> <dbl>
## 1 0 0.243
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## hst_lokbus name
## <int> <dbl>
## 1 0 1.75
## 2 1 2
Fährt an der nächstgelegenen Haltestelle ein Regionalbus weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 23.383 1.34e-06 ***
## 16441
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by hst_regbus
## t = 1.556, df = 11382, p-value = 0.1197
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.00237894 0.02069353
## sample estimates:
## mean in group 0 mean in group 1
## 0.2965379 0.2873806
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 -0.00916 -0.0207 0.00238 0.12 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_regbus name
## <int> <dbl>
## 1 0 0.301
## 2 1 0.243
## [1] 2
## # A tibble: 2 x 2
## hst_regbus name
## <int> <dbl>
## 1 0 2
## 2 1 1.75
Fährt an der nächstgelegenen Haltestelle eine Eisenbahn weg? Ja (1)/Nein (0)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 38.629 5.25e-10 ***
## 16441
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by hst_bahn
## t = 11.038, df = 814.72, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.1071581 0.1535122
## sample estimates:
## mean in group 0 mean in group 1
## 0.2960280 0.1656929
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 -0.130 -0.154 -0.107 0 ****
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## hst_bahn name
## <dbl> <dbl>
## 1 0 0.301
## 2 1 0.176
## [1] 2
## # A tibble: 2 x 2
## hst_bahn name
## <dbl> <dbl>
## 1 0 2
## 2 1 1.5
## [1] "hh_nr" "pers_nr"
## [3] "hh_wohnbdl" "hh_wohnraumtyp"
## [5] "pers_alter" "pers_alter_kat"
## [7] "pers_geschlecht" "pers_bildung"
## [9] "pers_beruf" "pers_arbeitsstd"
## [11] "pers_arbeitflex" "pers_arbeittele"
## [13] "pers_arbeit_parkpl" "pers_fs_krad"
## [15] "pers_fs_pkw" "pers_fahrrad"
## [17] "pers_krad" "pers_pkw"
## [19] "pers_oev_zeitkarte" "pers_oev_ermaessigung"
## [21] "pers_navi_pkw" "pers_navi_oev"
## [23] "pers_navi_andere" "pers_betr_kind"
## [25] "pers_betr_verwandte" "pers_betr_andere"
## [27] "pers_hochrechnungsfaktor"
Negative Werte werden zu NAs umgewandelt, um besser rechnen zu können.
Negative Werte werden zu NA umgeformt. “Nein”-Antworten, die im ÖU 2013/2014-Datensatz mit 2 codiert wurden, werden zu 0 codiert und so an den VAO-Datensatz angepasst.
Da die Zugangszeiten nur auf Haushaltsebene vorhanden sind, ist der Personendatensatz auf Haushaltsebene umzurechnen. Allerdings ist dies nicht bei allen Variablen sinnvoll. Umrechnung der Arbeitsstunden auf Haushaltsebene funktionierte nicht, da vermutlich zu viele NAs enthalten sind.
## `summarise()` ungrouping output (override with `.groups` argument)
Negative Werte werden zu NAs umgewandelt, um besser rechnen zu können.
Auf Haushaltsebene: Besitzen alle Personen des Haushalts eine ÖV-Zeitkarte oder nur manche oder niemand? - 0 … niemand besitzt eine ÖV-Zeitkarte - 1 … mindestens eine Person im Haushalt, aber nicht jede besitzt eine ÖV-Zeitkarte - 2 … alle Personen im Haushalt besitzen eine ÖV-Zeitkarte
Die Klassifizierung ist für die statistische Auswertung erforderlich.
## tibble [17,070 x 22] (S3: tbl_df/tbl/data.frame)
## $ hh_nr : Factor w/ 17070 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ mean_pers_alter : num [1:17070] 62 40 29 47 44 56 38 64 24 34 ...
## $ max_pers_bildung : num [1:17070] 3 4 3 5 4 3 5 5 3 5 ...
## $ mean_pers_arbeitsstd : num [1:17070] NA NA NA NA NA NA NA NA NA NA ...
## $ max_pers_arbeitflex : num [1:17070] -Inf 1 1 1 0 ...
## $ max_pers_arbeittele : num [1:17070] -Inf 0 0 0 0 ...
## $ max_pers_arbeit_parkpl : num [1:17070] -Inf 3 3 1 3 ...
## $ max_pers_fs_krad : num [1:17070] 0 1 1 0 0 1 0 0 1 1 ...
## $ max_pers_fs_pkw : num [1:17070] 1 1 1 1 1 1 1 1 1 1 ...
## $ max_pers_fahrrad : num [1:17070] 1 1 1 1 1 ...
## $ max_pers_krad : num [1:17070] -Inf 1 1 0 -Inf ...
## $ max_pers_pkw : num [1:17070] 3 3 3 3 3 3 3 3 3 3 ...
## $ max_pers_oev_zeitkarte : num [1:17070] 0 1 1 1 1 0 1 0 0 0 ...
## $ max_pers_oev_ermaessigung: num [1:17070] 0 1 1 1 1 0 1 0 0 0 ...
## $ max_pers_navi_pkw : num [1:17070] 1 0 1 0 1 1 1 1 1 1 ...
## $ max_pers_navi_oev : num [1:17070] 0 1 1 0 1 1 1 0 0 0 ...
## $ max_pers_navi_andere : num [1:17070] 0 1 0 0 1 1 1 0 0 1 ...
## $ max_pers_betr_kind : num [1:17070] 0 0 0 0 1 0 1 0 0 1 ...
## $ max_pers_betr_verwandte : num [1:17070] 0 1 0 0 0 1 0 0 0 0 ...
## $ max_pers_betr_andere : num [1:17070] 0 0 0 0 0 0 0 0 0 0 ...
## $ nutz_oev_zeitkarte : num [1:17070] 0 1 1 2 1 0 2 0 0 0 ...
## $ mean_pers_alter_kat : Factor w/ 8 levels "1","2","3","4",..: 7 5 4 6 5 7 5 7 3 4 ...
## 'data.frame': 17070 obs. of 49 variables:
## $ hh_nr : Factor w/ 17070 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
## $ hst_gehdauer : num 4 2 10 1 3 6 1 7 2 1 ...
## $ hst_gehlaenge : num 466 156 1040 137 324 699 207 592 170 165 ...
## $ hst_vm : int 1 1 1 1 1 1 1 1 1 1 ...
## $ hst_ubahn : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ hst_tram : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 2 1 1 1 ...
## $ hst_lokbus : int 0 0 0 0 0 0 0 0 0 1 ...
## $ hst_regbus : int 1 1 1 1 1 1 0 1 1 0 ...
## $ hst_type : Factor w/ 2 levels "4","5": 1 1 1 1 1 1 1 1 1 1 ...
## $ hst_kategorie : Ord.factor w/ 8 levels "I"<"II"<"III"<..: NA 7 NA NA 6 8 3 NA 7 7 ...
## $ hst_gehdauer_kat : Factor w/ 9 levels "1","2","3","4",..: 3 3 4 3 3 4 3 4 3 3 ...
## $ hst_bus : Factor w/ 2 levels "0","1": 2 2 2 2 2 2 1 2 2 2 ...
## $ hst_bahn : num 0 0 0 0 0 0 0 0 0 0 ...
## $ hh_wohnbdl : Factor w/ 9 levels "1","2","3","4",..: 6 6 3 3 3 1 9 1 7 2 ...
## $ hh_wohnraumtyp : Factor w/ 4 levels "1","2","3","4": 4 4 4 4 3 4 1 4 3 3 ...
## $ hh_wohnbezirk : Factor w/ 116 levels "101","103","104",..: 80 71 39 34 42 8 106 3 83 10 ...
## $ hh_wohngemeinde : Factor w/ 116 levels "101","103","104",..: 80 71 39 34 42 8 106 3 83 10 ...
## $ hh_gr : int 2 4 4 3 4 2 3 2 4 3 ...
## $ hh_gru6 : int 0 0 0 0 0 0 0 0 0 1 ...
## $ hh_gr617 : int 0 1 2 0 0 0 1 0 2 0 ...
## $ hh_grue18 : int 2 3 2 3 4 2 2 2 2 2 ...
## $ hgr_kat : Ord.factor w/ 4 levels "1"<"2"<"3"<"4": 2 4 4 3 4 2 3 2 4 3 ...
## $ hh_oev_entf : int 25 3 20 7 7 35 3 6 1 5 ...
## $ hh_oev_entf_kat : Ord.factor w/ 6 levels "1"<"2"<"3"<"4"<..: 3 1 3 2 2 4 1 2 1 1 ...
## $ hh_oev_bus : Factor w/ 2 levels "0","1": 2 2 2 1 2 2 1 2 2 2 ...
## $ hh_oev_strb : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 2 1 1 1 ...
## $ hh_oev_ubahn : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ hh_oev_bahn : Factor w/ 2 levels "0","1": 2 2 1 2 2 1 1 1 1 1 ...
## $ hh_carsharing : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ hh_wirtschsituation : Ord.factor w/ 5 levels "1"<"2"<"3"<"4"<..: 3 4 4 4 3 4 4 4 4 4 ...
## $ fzg_radges : int 2 3 4 1 4 2 3 1 4 2 ...
## $ fzg_e_rad : int 0 NA 0 NA 0 1 0 0 NA 0 ...
## $ fzg_mot : int 0 3 1 NA 0 NA 0 0 1 0 ...
## $ fzg_pkw : int 1 3 2 2 2 2 1 2 2 2 ...
## $ hh_hochrechnungsfaktor: num 134.3 163.6 17.9 83.6 358 ...
## $ hh_kobasis : Factor w/ 6 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 2 ...
## $ hh_öv_güte : Factor w/ 7 levels "A","B","C","D",..: NA 6 NA 5 NA NA 3 NA 6 4 ...
## $ hh_oev_entf_kat_neu : Factor w/ 9 levels "1","2","3","4",..: 5 3 5 4 4 6 3 4 3 3 ...
## $ GKZ_neu : int 62376 61013 32131 31628 32144 10915 90001 10402 70337 20201 ...
## $ GEMNAME : chr "Bad Radkersburg" "Großklein" "Sieghartskirchen" "Kreuzstetten" ...
## $ UR_TYP : Ord.factor w/ 11 levels "101"<"102"<"103"<..: 5 9 6 8 3 10 1 11 1 2 ...
## $ POP_2015 : int 3092 2260 7245 1545 26463 1000 1797337 1382 2945 60500 ...
## $ seit : chr "01.01.2015" NA "01.01.2017" "01.01.2017" ...
## $ gemname_alt : chr "Radkersburg Umgebung" "Großklein" "Sieghartskirchen" "Kreuzstetten" ...
## $ hst_zug : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ gleich_entf_fakt : num 6.25 1.5 2 7 2.33 ...
## $ gleich_entf_fakt_lg : num 0.796 0.176 0.301 0.845 0.368 ...
## $ gleich_entf_kat : Factor w/ 5 levels "5","4","3","2",..: 1 3 3 1 2 1 2 4 2 1 ...
## $ hst_gehlaenge_kat : Ord.factor w/ 6 levels "1"<"2"<"3"<"4"<..: 1 1 3 1 1 2 1 2 1 1 ...
Die auf Haushaltsebene umgerechneten Personendaten werden an den Datensatz “Vergleich” angehängt.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 3.63 0.05684 .
## 3225
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Hypothesentests
Post-hoc-Tests
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_geschlecht
##
## 1
## 2 0.0024
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 7 2.5736 0.01193 *
## 16435
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and mean_pers_alter_kat
## F = 55.565, num df = 7.00, denom df = 194.16, p-value < 2.2e-16
## # A tibble: 28 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fak~ 1 2 0.120 -0.142 0.382 0.791 ns
## 2 gleich_entf_fak~ 1 3 0.171 -0.0681 0.410 0.248 ns
## 3 gleich_entf_fak~ 1 4 0.202 -0.0357 0.440 0.117 ns
## 4 gleich_entf_fak~ 1 5 0.234 -0.00436 0.472 0.056 ns
## 5 gleich_entf_fak~ 1 6 0.261 0.0224 0.499 0.029 *
## 6 gleich_entf_fak~ 1 7 0.288 0.0496 0.526 0.015 *
## 7 gleich_entf_fak~ 1 8 0.342 0.104 0.580 0.004 **
## 8 gleich_entf_fak~ 2 3 0.0514 -0.0964 0.199 0.959 ns
## 9 gleich_entf_fak~ 2 4 0.0825 -0.0604 0.225 0.618 ns
## 10 gleich_entf_fak~ 2 5 0.114 -0.0292 0.257 0.218 ns
## # ... with 18 more rows
## `summarise()` ungrouping output (override with `.groups` argument)
Null Beobachtungen in der Alterskategorie 6-14 Jahre.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 6 1.486 0.1787
## 3220
Hypothesentests
Post-hoc-Tests
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_alter_kat
##
## 2 3 4 5 6 7
## 3 1.00000 - - - - -
## 4 1.00000 0.31359 - - - -
## 5 1.00000 0.41473 1.00000 - - -
## 6 1.00000 0.03312 1.00000 1.00000 - -
## 7 1.00000 0.00039 0.06850 0.07693 0.94338 -
## 8 0.41406 7.9e-08 9.1e-08 3.4e-07 4.4e-06 0.05573
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
Die jeweils höchste Ausbildung von den in einem Haushalt lebenden Personen wird hierfür herangezogen.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 5.7309 0.0001321 ***
## 16286
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and max_pers_bildung
## F = 29.693, num df = 4.00, denom df = 513.15, p-value < 2.2e-16
## # A tibble: 10 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf~ 1 2 0.0764 -0.0548 0.208 4.86e-1 ns
## 2 gleich_entf~ 1 3 0.0413 -0.0868 0.169 8.95e-1 ns
## 3 gleich_entf~ 1 4 0.00183 -0.127 0.130 1.00e+0 ns
## 4 gleich_entf~ 1 5 -0.0215 -0.150 0.107 9.90e-1 ns
## 5 gleich_entf~ 2 3 -0.0351 -0.0694 -0.000777 4.20e-2 *
## 6 gleich_entf~ 2 4 -0.0746 -0.111 -0.0386 1.75e-7 ****
## 7 gleich_entf~ 2 5 -0.0980 -0.133 -0.0632 0. ****
## 8 gleich_entf~ 3 4 -0.0395 -0.0601 -0.0190 1.60e-6 ****
## 9 gleich_entf~ 3 5 -0.0629 -0.0813 -0.0444 0. ****
## 10 gleich_entf~ 4 5 -0.0234 -0.0447 -0.00201 2.40e-2 *
## `summarise()` ungrouping output (override with `.groups` argument)
Die höchste abgeschlossene Ausbildung von in Einpersonenhaushalten lebenden Personen wird hierfür herangezogen.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 2.8829 0.02135 *
## 3171
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and pers_bildung
## F = 10.6, num df = 4.00, denom df = 157.86, p-value = 1.239e-07
## # A tibble: 10 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf~ 1 2 -0.0121 -0.216 0.192 1.00e+0 ns
## 2 gleich_entf~ 1 3 -0.0338 -0.235 0.168 9.87e-1 ns
## 3 gleich_entf~ 1 4 -0.0598 -0.263 0.143 9.05e-1 ns
## 4 gleich_entf~ 1 5 -0.125 -0.328 0.0772 3.81e-1 ns
## 5 gleich_entf~ 2 3 -0.0217 -0.0746 0.0312 7.95e-1 ns
## 6 gleich_entf~ 2 4 -0.0477 -0.108 0.0129 1.99e-1 ns
## 7 gleich_entf~ 2 5 -0.113 -0.170 -0.0562 7.27e-7 ****
## 8 gleich_entf~ 3 4 -0.0260 -0.0744 0.0224 5.84e-1 ns
## 9 gleich_entf~ 3 5 -0.0914 -0.135 -0.0477 1.34e-7 ****
## 10 gleich_entf~ 4 5 -0.0654 -0.118 -0.0126 7.00e-3 **
## `summarise()` ungrouping output (override with `.groups` argument)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.895 0.4429
## 3223
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_beruf 3 8.3 2.7819 21.77 5.88e-14 ***
## Residuals 3223 411.8 0.1278
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 429 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_beruf
##
## 1 2 3
## 2 0.61679 - -
## 3 0.00022 8.7e-10 -
## 4 1.00000 0.24386 1.4e-07
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
Hat eine Person im Haushalt flexible Arbeitszeiten? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.0093 0.9231
## 10764
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_arbeitflex 1 1.2 1.2362 9.412 0.00216 **
## Residuals 10764 1413.8 0.1313
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 6304 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_arbeitflex
##
## 0
## 1 0.0022
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.2218487
## # A tibble: 2 x 2
## max_pers_arbeitflex name
## <fct> <dbl>
## 1 0 0.222
## 2 1 0.222
## [1] 1.666667
## # A tibble: 2 x 2
## max_pers_arbeitflex name
## <fct> <dbl>
## 1 0 1.67
## 2 1 1.67
Hat für die im Einpersonenhaushalt lebende Person flexible Arbeitszeiten? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 4.8932 0.02711 *
## 1522
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by pers_arbeitflex
## t = 1.3414, df = 1429.1, p-value = 0.18
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -0.01125831 0.05995544
## sample estimates:
## mean in group 0 mean in group 1
## 0.3041530 0.2798044
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 -0.0243 -0.0600 0.0113 0.18 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_arbeitflex name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_arbeitflex name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Ist Telearbeit für zumindest eine Person im Haushalt möglich? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 2.5336 0.1115
## 10706
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_arbeittele 1 4.2 4.184 31.9 1.66e-08 ***
## Residuals 10706 1404.1 0.131
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 6362 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_arbeittele
##
## 0
## 1 1.7e-08
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.2218487
## # A tibble: 2 x 2
## max_pers_arbeittele name
## <fct> <dbl>
## 1 0 0.222
## 2 1 0.222
## [1] 1.666667
## # A tibble: 2 x 2
## max_pers_arbeittele name
## <fct> <dbl>
## 1 0 1.67
## 2 1 1.67
Ist Telearbeit für die im Einpersonenhaushalt lebende Person möglich? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2503 0.6169
## 1515
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_arbeittele 1 0.65 0.6493 5.216 0.0225 *
## Residuals 1515 188.61 0.1245
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 2139 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_arbeittele
##
## 0
## 1 0.023
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_arbeittele name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.222
## [1] 2
## # A tibble: 2 x 2
## pers_arbeittele name
## <fct> <dbl>
## 1 0 2
## 2 1 1.67
Hat zumindest eine Person aus dem Haushalt eine PKW-Abstellmöglichkeit am Arbeitsplatz? - 1 … Nein - 2 … Unterschiedlich - 3 … Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 3.6643 0.02565 *
## 10762
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and max_pers_arbeit_parkpl
## F = 8.3891, num df = 2.00, denom df = 50.84, p-value = 0.0007104
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 1 2 0.158 0.00565 0.310 0.041 *
## 2 gleich_entf_fakt~ 1 3 -0.0223 -0.0402 -0.00446 0.01 **
## 3 gleich_entf_fakt~ 2 3 -0.180 -0.332 -0.0283 0.019 *
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.2218487
## # A tibble: 3 x 2
## max_pers_arbeit_parkpl name
## <fct> <dbl>
## 1 1 0.301
## 2 2 0.458
## 3 3 0.222
## [1] 1.666667
## # A tibble: 3 x 2
## max_pers_arbeit_parkpl name
## <fct> <dbl>
## 1 1 2
## 2 2 2.88
## 3 3 1.67
Hat eine Person in einem Einpersonenhaushalt eine PKW-Abstellmöglichkeit am Arbeitsplatz? - 1 … Nein - 2 … Unterschiedlich - 3 … Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 5.494 0.004194 **
## 1522
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and pers_arbeit_parkpl
## F = 1.379, num df = 2.000, denom df = 10.706, p-value = 0.2932
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 1 2 0.222 -0.344 0.787 0.427 ns
## 2 gleich_entf_fakt~ 1 3 -0.0166 -0.0588 0.0255 0.625 ns
## 3 gleich_entf_fakt~ 2 3 -0.238 -0.804 0.327 0.384 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 3 x 2
## pers_arbeit_parkpl name
## <fct> <dbl>
## 1 1 0.301
## 2 2 0.477
## 3 3 0.301
## [1] 2
## # A tibble: 3 x 2
## pers_arbeit_parkpl name
## <fct> <dbl>
## 1 1 2
## 2 2 3
## 3 3 2
Hat zumindest eine Person aus dem Haushalt einen Führerschein für Moped oder Motorrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.335 0.2479
## 16285
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_fs_krad 1 4.6 4.570 34.36 4.66e-09 ***
## Residuals 16285 2165.7 0.133
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 783 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_fs_krad
##
## 0
## 1 4.7e-09
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_fs_krad name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.222
## [1] 2
## # A tibble: 2 x 2
## max_pers_fs_krad name
## <fct> <dbl>
## 1 0 2
## 2 1 1.67
Hat eine in einem Einpersonenhaushalt wohnende Person einen Führerschein für Moped oder Motorrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 3.5201 0.06072 .
## 3179
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_fs_krad 1 0.6 0.6011 4.621 0.0317 *
## Residuals 3179 413.5 0.1301
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 475 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fs_krad
##
## 0
## 1 0.032
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_fs_krad name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_fs_krad name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Hat zumindest eine Person aus dem Haushalt einen PKW-Führerschein? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.1982 0.2737
## 16283
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_fs_pkw 1 1.9 1.8524 13.92 0.000192 ***
## Residuals 16283 2167.5 0.1331
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 785 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_fs_pkw
##
## 0
## 1 0.00019
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_fs_pkw name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.273
## [1] 2
## # A tibble: 2 x 2
## max_pers_fs_pkw name
## <fct> <dbl>
## 1 0 2
## 2 1 1.88
Hat zumindest eine Person aus dem Haushalt einen PKW-Führerschein? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.8966 0.1686
## 3178
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_fs_pkw 1 0.6 0.5877 4.523 0.0335 *
## Residuals 3178 413.0 0.1300
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 476 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fs_pkw
##
## 0
## 1 0.034
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_fs_pkw name
## <fct> <dbl>
## 1 0 0.398
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_fs_pkw name
## <fct> <dbl>
## 1 0 2.5
## 2 1 2
Hat zumindest eine Person aus dem Haushalt ein Fahrrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 3.971 0.04631 *
## 14769
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by max_pers_fahrrad
## t = 7.119, df = 4050.8, p-value = 1.28e-12
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.04041555 0.07113642
## sample estimates:
## mean in group 0 mean in group 1
## 0.3301436 0.2743676
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 0 1 -0.0558 -0.0711 -0.0404 2.81e-8 ****
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.2730013
## # A tibble: 2 x 2
## max_pers_fahrrad name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.222
## [1] 1.875
## # A tibble: 2 x 2
## max_pers_fahrrad name
## <fct> <dbl>
## 1 0 2
## 2 1 1.67
Hat zumindest eine Person aus dem Haushalt ein Fahrrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.7691 0.3806
## 2824
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_fahrrad 1 1.8 1.7867 13.97 0.000189 ***
## Residuals 2824 361.1 0.1279
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 830 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_fahrrad
##
## 0
## 1 0.00019
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_fahrrad name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_fahrrad name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Hat zumindest eine Person aus dem Haushalt ein Moped/Motorrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.6239 0.4296
## 7704
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_krad 1 0.1 0.06189 0.453 0.501
## Residuals 7704 1052.6 0.13663
## 9364 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_krad
##
## 0
## 1 0.5
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.2218487
## # A tibble: 2 x 2
## max_pers_krad name
## <fct> <dbl>
## 1 0 0.222
## 2 1 0.222
## [1] 1.666667
## # A tibble: 2 x 2
## max_pers_krad name
## <fct> <dbl>
## 1 0 1.67
## 2 1 1.67
Hat zumindest eine Person aus dem Haushalt ein Moped/Motorrad? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.5096 0.4755
## 871
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_krad 1 0.02 0.02227 0.151 0.698
## Residuals 871 128.60 0.14765
## 2783 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_krad
##
## 0
## 1 0.7
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_krad name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_krad name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Hat zumindest eine Person aus dem Haushalt einen PKW zur Verfügung? - 1 … nie - 2 … gelegentlich - 3 … jederzeit
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 3.9497 0.01928 *
## 15794
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and max_pers_pkw
## F = 9.5778, num df = 2.0, denom df = 1843.2, p-value = 7.276e-05
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_f~ 1 2 -0.0602 -9.32e-2 -0.0272 5.75e-5 ****
## 2 gleich_entf_f~ 1 3 -0.0363 -6.04e-2 -0.0121 1.00e-3 ***
## 3 gleich_entf_f~ 2 3 0.0239 -8.84e-4 0.0488 6.20e-2 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 3 x 2
## max_pers_pkw name
## <ord> <dbl>
## 1 1 0.301
## 2 2 0.222
## 3 3 0.273
## [1] 2
## # A tibble: 3 x 2
## max_pers_pkw name
## <ord> <dbl>
## 1 1 2
## 2 2 1.67
## 3 3 1.88
Hat zumindest eine Person aus dem Haushalt einen PKW zur Verfügung? - 1 … nie - 2 … gelegentlich - 3 … jederzeit
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 4.2996 0.01366 *
## 2967
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and pers_pkw
## F = 4.841, num df = 2.00, denom df = 697.67, p-value = 0.008167
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 1 2 -0.0711 -0.126 -0.0159 0.007 **
## 2 gleich_entf_fakt~ 1 3 -0.0302 -0.0658 0.00528 0.113 ns
## 3 gleich_entf_fakt~ 2 3 0.0409 -0.00974 0.0915 0.14 ns
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 3 x 2
## pers_pkw name
## <ord> <dbl>
## 1 1 0.368
## 2 2 0.301
## 3 3 0.301
## [1] 2
## # A tibble: 3 x 2
## pers_pkw name
## <ord> <dbl>
## 1 1 2.33
## 2 2 2
## 3 3 2
Hat zumindest eine Person aus dem Haushalt eine Wochen-, Monats- oder Jahreskarte für den öffentlichen Verkehr? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 30.755 2.973e-08 ***
## 16067
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by max_pers_oev_zeitkarte
## t = 5.0781, df = 11551, p-value = 3.872e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.01849363 0.04174689
## sample estimates:
## mean in group 0 mean in group 1
## 0.2993718 0.2692516
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 0 1 -0.0301 -0.0417 -0.0185 3.86e-7 ****
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_oev_zeitkarte name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.243
## [1] 2
## # A tibble: 2 x 2
## max_pers_oev_zeitkarte name
## <fct> <dbl>
## 1 0 2
## 2 1 1.75
Hat eine im Einpersonenhaushalt lebende Person eine Wochen-, Monats- oder Jahreskarte für den öffentlichen Verkehr? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 15.973 6.574e-05 ***
## 3149
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by pers_oev_zeitkarte
## t = 2.6547, df = 1926.7, p-value = 0.008003
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.009224763 0.061396845
## sample estimates:
## mean in group 0 mean in group 1
## 0.3337874 0.2984766
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 -0.0353 -0.0614 -0.00922 0.008 **
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_oev_zeitkarte name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_oev_zeitkarte name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Auf Haushaltsebene: Besitzen alle Personen des Haushalts eine ÖV-Zeitkarte oder nur manche oder niemand? - 0 … niemand besitzt eine ÖV-Zeitkarte (ÖV-averser Haushalt) - 1 … mindestens eine Person im Haushalt, aber nicht jede besitzt eine ÖV-Zeitkarte (ÖV-gemischter Haushalt) - 2 … alle Personen im Haushalt besitzen eine ÖV-Zeitkarte (ÖV-affiner Haushalt)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 20.242 1.66e-09 ***
## 16066
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and nutz_oev_zeitkarte
## F = 15.182, num df = 2.0, denom df = 5088.2, p-value = 2.667e-07
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_~ 0 1 -0.0396 -5.67e-2 -0.0225 1.82e-7 ****
## 2 gleich_entf_~ 0 2 -0.0172 -3.56e-2 0.00122 7.30e-2 ns
## 3 gleich_entf_~ 1 2 0.0224 2.74e-4 0.0444 4.60e-2 *
## `summarise()` ungrouping output (override with `.groups` argument)
Hat zumindest eine Person aus dem Haushalt eine Ermäßigung für den öffentlichen Verkehr? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 6.7384 0.009445 **
## 16067
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Welch Two Sample t-test
##
## data: gleich_entf_fakt_lg by max_pers_oev_ermaessigung
## t = 2.6472, df = 8838.8, p-value = 0.008131
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 0.004292012 0.028786351
## sample estimates:
## mean in group 0 mean in group 1
## 0.2940864 0.2775472
## # A tibble: 1 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_fakt~ 0 1 -0.0165 -0.0288 -0.00429 0.008 **
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_oev_ermaessigung name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## max_pers_oev_ermaessigung name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Hat zumindest eine Person aus dem Haushalt eine Ermäßigung für den öffentlichen Verkehr? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 2.2377 0.1348
## 3149
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_oev_ermaessigung 1 0.0 0.00759 0.058 0.809
## Residuals 3149 409.9 0.13015
## 505 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_oev_ermaessigung
##
## 0
## 1 0.81
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_oev_ermaessigung name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_oev_ermaessigung name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Betreut zumindest eine Person im Haushalt ein Kind? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.4795 0.2239
## 16113
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_betr_kind 1 3.1 3.0734 23.12 1.54e-06 ***
## Residuals 16113 2141.9 0.1329
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 955 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_kind
##
## 0
## 1 1.5e-06
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_betr_kind name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.222
## [1] 2
## # A tibble: 2 x 2
## max_pers_betr_kind name
## <fct> <dbl>
## 1 0 2
## 2 1 1.67
Betreut zumindest eine Person im Haushalt ein Kind? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.0359 0.8497
## 3156
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_betr_kind 1 0.4 0.4240 3.289 0.0698 .
## Residuals 3156 406.8 0.1289
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 498 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_kind
##
## 0
## 1 0.07
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_betr_kind name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_betr_kind name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Betreut zumindest eine Person im Haushalt eine/n Verwandte/n? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.3438 0.5577
## 16113
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_betr_verwandte 1 0 0.00371 0.028 0.867
## Residuals 16113 2145 0.13312
## 955 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_verwandte
##
## 0
## 1 0.87
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_betr_verwandte name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.270
## [1] 2
## # A tibble: 2 x 2
## max_pers_betr_verwandte name
## <fct> <dbl>
## 1 0 2
## 2 1 1.86
Betreut zumindest eine Person im Haushalt eine/n Verwandte/n? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 2.2937 0.13
## 3156
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_betr_verwandte 1 0.0 0.02216 0.172 0.679
## Residuals 3156 407.2 0.12904
## 498 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_verwandte
##
## 0
## 1 0.68
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_betr_verwandte name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_betr_verwandte name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Betreut zumindest eine Person im Haushalt eine andere Person? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.3143 0.2516
## 16113
## Df Sum Sq Mean Sq F value Pr(>F)
## max_pers_betr_andere 1 0.1 0.1214 0.912 0.34
## Residuals 16113 2144.9 0.1331
## 955 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich$gleich_entf_fakt_lg and Vergleich$max_pers_betr_andere
##
## 0
## 1 0.34
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## max_pers_betr_andere name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## max_pers_betr_andere name
## <fct> <dbl>
## 1 0 2
## 2 1 2
Betreut zumindest eine Person im Haushalt eine andere Person? Nein/Ja
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.024 0.8768
## 3156
## Df Sum Sq Mean Sq F value Pr(>F)
## pers_betr_andere 1 0.3 0.3119 2.419 0.12
## Residuals 3156 407.0 0.1290
## 498 observations deleted due to missingness
##
## Pairwise comparisons using t tests with pooled SD
##
## data: Vergleich1$gleich_entf_fakt_lg and Vergleich1$pers_betr_andere
##
## 0
## 1 0.12
##
## P value adjustment method: bonferroni
## `summarise()` ungrouping output (override with `.groups` argument)
## [1] 0.30103
## # A tibble: 2 x 2
## pers_betr_andere name
## <fct> <dbl>
## 1 0 0.301
## 2 1 0.301
## [1] 2
## # A tibble: 2 x 2
## pers_betr_andere name
## <fct> <dbl>
## 1 0 2
## 2 1 2
## [1] "hh_nr"
## [2] "pers_nr"
## [3] "perstag_stnr"
## [4] "hh_wohnbdl"
## [5] "hh_wohnraumtyp"
## [6] "perstag_jahr"
## [7] "perstag_jzeit"
## [8] "perstag_tag"
## [9] "perstag_wttyp"
## [10] "weg_nr"
## [11] "weg_startzeit"
## [12] "weg_startgemeinde"
## [13] "weg_startbezirk"
## [14] "weg_startbdl"
## [15] "weg_startraumtyp"
## [16] "weg_startland"
## [17] "weg_quellzweck"
## [18] "weg_zielzweck"
## [19] "weg_zweck"
## [20] "weg_vm_fuss"
## [21] "weg_vm_rad"
## [22] "weg_vm_pkwlenk"
## [23] "weg_vm_pkwmit"
## [24] "weg_vm_krad"
## [25] "weg_vm_bus"
## [26] "weg_vm_strab"
## [27] "weg_vm_bahn"
## [28] "weg_vm_flug"
## [29] "weg_vm_schiff"
## [30] "weg_vm_taxi"
## [31] "weg_vm_fernz"
## [32] "weg_vm_reisebus"
## [33] "weg_vm_anderes"
## [34] "weg_vm_haupt"
## [35] "weg_vm_haupt_kl"
## [36] "weg_zielzeit"
## [37] "weg_zielgemeinde"
## [38] "weg_zielbezirk"
## [39] "weg_zielbdl"
## [40] "weg_zielraumtyp"
## [41] "weg_zielland"
## [42] "weg_dauer"
## [43] "weg_dauer_kat"
## [44] "weg_laenge"
## [45] "weg_laenge_kat"
## [46] "weg_hochrechnungsfaktor_woche"
## [47] "weg_hochrechnungsfaktor_werktag"
## [48] "weg_hochrechnungsfaktor_samstag"
## [49] "weg_hochrechnungsfaktor_sonntag"
## [50] "weg_hochrechnungsfaktor_herbst_werktag"
Zwecks Vereinfachung fürs Rechnen werden alle negativen Werte (nicht anwendbar oder keine Angabe) zu NA umgerechnet, da R fehlende Werte in vielen Fällen automatisch bei Rechnungen ignoriert.
Es wird eine neue Spalte eingefügt, die Auskunft darüber gibt, ob der ÖV das Hauptverkehrsmittel am Weg war oder nicht. (Ja = 1, Nein = 0)
Es wird nun umgerechnet, ob alle, manche oder gar keine Wege innerhalb eines Haushaltes mit dem ÖV zurückgelegt wurden. Dies wird über die Berechnung des Durchschnitts der zuvor neu eingeführten Variable ermittelt.
0 = gar keine 0 < x < 1 = manche 1 = alle
## `summarise()` ungrouping output (override with `.groups` argument)
Dies wird nun dem großen Datensatz angefügt. Zuerst werden aber folgende neue Kategorien gebildet: 1 … gar keine (vormals 0) 2 … gemischt (0 < x < 1) 3 … alle (vormals 1)
## [1] "hh_nr" "hst_gehdauer"
## [3] "hst_gehlaenge" "hst_vm"
## [5] "hst_ubahn" "hst_tram"
## [7] "hst_lokbus" "hst_regbus"
## [9] "hst_type" "hst_kategorie"
## [11] "hst_gehdauer_kat" "hst_bus"
## [13] "hst_bahn" "hh_wohnbdl"
## [15] "hh_wohnraumtyp" "hh_wohnbezirk"
## [17] "hh_wohngemeinde" "hh_gr"
## [19] "hh_gru6" "hh_gr617"
## [21] "hh_grue18" "hgr_kat"
## [23] "hh_oev_entf" "hh_oev_entf_kat"
## [25] "hh_oev_bus" "hh_oev_strb"
## [27] "hh_oev_ubahn" "hh_oev_bahn"
## [29] "hh_carsharing" "hh_wirtschsituation"
## [31] "fzg_radges" "fzg_e_rad"
## [33] "fzg_mot" "fzg_pkw"
## [35] "hh_hochrechnungsfaktor" "hh_kobasis"
## [37] "hh_öv_güte" "hh_oev_entf_kat_neu"
## [39] "GKZ_neu" "GEMNAME"
## [41] "UR_TYP" "POP_2015"
## [43] "seit" "gemname_alt"
## [45] "hst_zug" "gleich_entf_fakt"
## [47] "gleich_entf_fakt_lg" "gleich_entf_kat"
## [49] "hst_gehlaenge_kat" "mean_pers_alter"
## [51] "max_pers_bildung" "mean_pers_arbeitsstd"
## [53] "max_pers_arbeitflex" "max_pers_arbeittele"
## [55] "max_pers_arbeit_parkpl" "max_pers_fs_krad"
## [57] "max_pers_fs_pkw" "max_pers_fahrrad"
## [59] "max_pers_krad" "max_pers_pkw"
## [61] "max_pers_oev_zeitkarte" "max_pers_oev_ermaessigung"
## [63] "max_pers_navi_pkw" "max_pers_navi_oev"
## [65] "max_pers_navi_andere" "max_pers_betr_kind"
## [67] "max_pers_betr_verwandte" "max_pers_betr_andere"
## [69] "nutz_oev_zeitkarte" "mean_pers_alter_kat"
## [71] "mean_hh_oev_haupt" "mean_hh_oev_haupt_kat"
Es gibt drei Kategorien, die aus den Einträgen im Wegetagebuch ergaben: 1 … es wurden gar keine Wege während des Beobachtungszeitraum mit dem ÖV zurückgelegt 2 … es wurden manche Wege mit dem ÖV zurückgelegt, aber nicht alle 3 … alle Personen im Haushalt haben alle ihre Wege mit dem ÖV zurückgelegt.
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 13.804 1.024e-06 ***
## 15428
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## One-way analysis of means (not assuming equal variances)
##
## data: gleich_entf_fakt_lg and mean_hh_oev_haupt_kat
## F = 17.088, num df = 2.0, denom df = 1426.9, p-value = 4.638e-08
## # A tibble: 3 x 8
## .y. group1 group2 estimate conf.low conf.high p.adj p.adj.signif
## * <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 gleich_entf_f~ 1 2 -0.0312 -0.0456 -0.0168 1.17e-6 ****
## 2 gleich_entf_f~ 1 3 0.0329 -0.00364 0.0695 8.70e-2 ns
## 3 gleich_entf_f~ 2 3 0.0641 0.0269 0.101 1.75e-4 ***
## `summarise()` ungrouping output (override with `.groups` argument)
Zunächst werden die entsprechenden Alterskategorien gebildet.
Nun wird die Alterspyramide erstellt.